智能论文笔记

Explainable AI for Bioinformatics: Methods, Tools, and Applications

Md. Rezaul Karim , Tanhim Islam , Oya Beyan , Christoph Lange , Michael Cochez , Dietrich Rebholz-Schuhmann , Stefan Decker

分类：人工智能 | 机器学习

2022-12-25

Artificial intelligence(AI) systems based on deep neural networks (DNNs) and machine learning (ML) algorithms are increasingly used to solve critical problems in bioinformatics, biomedical informatics, and precision medicine. However, complex DNN or ML models that are unavoidably opaque and perceived as black-box methods, may not be able to explain why and how they make certain decisions. Such black-box models are difficult to comprehend not only for targeted users and decision-makers but also for AI developers. Besides, in sensitive areas like healthcare, explainability and accountability are not only desirable properties of AI but also legal requirements -- especially when AI may have significant impacts on human lives. Explainable artificial intelligence (XAI) is an emerging field that aims to mitigate the opaqueness of black-box models and make it possible to interpret how AI systems make their decisions with transparency. An interpretable ML model can explain how it makes predictions and which factors affect the model's outcomes. The majority of state-of-the-art interpretable ML methods have been developed in a domain-agnostic way and originate from computer vision, automated reasoning, or even statistics. Many of these methods cannot be directly applied to bioinformatics problems, without prior customization, extension, and domain adoption. In this paper, we discuss the importance of explainability with a focus on bioinformatics. We analyse and comprehensively overview of model-specific and model-agnostic interpretable ML methods and tools. Via several case studies covering bioimaging, cancer genomics, and biomedical text mining, we show how bioinformatics research could benefit from XAI methods and how they could help improve decision fairness.

translated by 谷歌翻译

Multimodal Across Domains Gaze Target Detection

Francesco Tonini , Cigdem Beyan , Elisa Ricci

分类：计算机视觉 | 人工智能

2022-08-23

本文解决了从第三人称角度捕获的单个图像中的目光目标检测问题。我们提出了一个多模式的深度建筑，以推断一个人在场景中所处的位置。该空间模型经过了代表丰富上下文信息的感兴趣人，场景和深度图的头部图像训练。我们的模型与几种先前的艺术不同，不需要对目光角度的监督，不依赖头部方向信息和/或利益人眼睛的位置。广泛的实验证明了我们方法在多个基准数据集上的性能更强。我们还通过改变多模式数据的联合学习来研究我们方法的几种变体。一些变化的表现也胜过一些先前的艺术。首次在本文中，我们检查了域名的凝视目标检测，并授权多模式网络有效地处理跨数据集的域间隙。该方法的代码可在https://github.com/francescotonini/multimodal-across-domains-domains-domains-domains-domains-warget-detection上获得。

translated by 谷歌翻译

Multimodal Emotion Recognition with Modality-Pairwise Unsupervised Contrastive Loss

Riccardo Franceschini , Enrico Fini , Cigdem Beyan , Alessandro Conti , Federica Arrigoni , Elisa Ricci

分类：计算机视觉 | 人工智能 | 机器学习

2022-07-23

情绪识别涉及几个现实世界应用。随着可用方式的增加，对情绪的自动理解正在更准确地进行。多模式情感识别（MER）的成功主要依赖于监督的学习范式。但是，数据注释昂贵，耗时，并且由于情绪表达和感知取决于几个因素（例如，年龄，性别，文化），获得具有高可靠性的标签很难。由这些动机，我们专注于MER的无监督功能学习。我们考虑使用离散的情绪，并用作模式文本，音频和视觉。我们的方法是基于成对方式之间的对比损失，是MER文献中的第一次尝试。与现有的MER方法相比，我们的端到端特征学习方法具有几种差异（和优势）：i）无监督，因此学习缺乏数据标记成本； ii）它不需要数据空间增强，模态对准，大量批量大小或时期； iii）它仅在推理时应用数据融合； iv）它不需要对情绪识别任务进行预训练的骨干。基准数据集上的实验表明，我们的方法优于MER中应用的几种基线方法和无监督的学习方法。特别是，它甚至超过了一些有监督的MER最先进的。

translated by 谷歌翻译

Face-to-Face Co-Located Human-Human Social Interaction Analysis using Nonverbal Cues: A Survey

Cigdem Beyan , Alessandro Vinciarelli , Alessio Del Bue

分类：人工智能 | 计算机视觉 | 机器学习

2022-07-20

这项工作对最近的努力进行了系统的综述（自2010年以来），旨在自动分析面对面共同关联的人类社交互动中显示的非语言提示。专注于非语言提示的主要原因是，这些是社会和心理现象的物理，可检测到的痕迹。因此，检测和理解非语言提示至少在一定程度上意味着检测和理解社会和心理现象。所涵盖的主题分为三个：a）建模社会特征，例如领导力，主导，人格特质，b）社会角色认可和社会关系检测以及c）群体凝聚力，同情，rapport和so的互动动态分析向前。我们针对共同的相互作用，其中相互作用的人永远是人类。该调查涵盖了各种各样的环境和场景，包括独立的互动，会议，室内和室外社交交流，二元对话以及人群动态。对于他们每个人，调查都考虑了非语言提示分析的三个主要要素，即数据，传感方法和计算方法。目的是突出显示过去十年的主要进步，指出现有的限制并概述未来的方向。

translated by 谷歌翻译

Stabilizing Off-Policy Deep Reinforcement Learning from Pixels

Edoardo Cetin , Philip J. Ball , Steve Roberts , Oya Celiktutan

分类：机器学习 | 人工智能 | 计算机视觉

2022-07-03

众所周知，从像素观察中进行的非质量增强学习（RL）是不稳定的。结果，许多成功的算法必须结合不同领域的实践和辅助损失，以在复杂的环境中学习有意义的行为。在这项工作中，我们提供了新颖的分析，表明这些不稳定性是通过卷积编码器和低质量奖励进行时间差异学习而产生的。我们表明，这种新的视觉致命三合会导致不稳定的训练和过早的融合归化解决方案，这是一种现象，我们将灾难性的自相传为。基于我们的分析，我们提出了A-LIX，这是一种为编码器梯度提供适应性正则化的方法，该梯度明确防止使用双重目标防止灾难性的自我抗辩发生。通过应用A-LIX，我们在DeepMind Control和Atari 100K基准测试方面显着优于先前的最先进，而无需任何数据增强或辅助损失。

translated by 谷歌翻译

GROWL: Group Detection With Link Prediction

Viktor Schmuck , Oya Celiktutan

分类：计算机视觉 | 机器人

2021-11-08

以前通过依赖于个人的位置和方向信息的自下而上的方法来解决交互组检测。这些方法主要基于成对亲和力矩阵，限制在静态，第三人称视图。由于形成交互组的个体之间存在的固有的空间配置，该问题可以大大受益于基于图形神经网络（GNNS）之外的图形神经网络（GNN）。我们所提出的方法，使用链路预测（Growl）进行组检测，证明了基于GNN的方法的有效性。 Growl通过基于图表中的邻域生成特征嵌入来预测两个人之间的链路，并确定它们是否与浅二进制分类方法（例如多层的Perceptrons（MLP）连接）。我们在第三人称数据集和RoboCentric（即，EGEntric）数据集上对其他最先进的组检测方法测试我们的方法。此外，我们提出了一种基于RGB和深度数据来计算表示可以用作输入的多模式方法。我们的研究结果表明，基于GNN的方法可以显着提高不同相机视图的准确性，即第三人称和EGEntric视图。

translated by 谷歌翻译

Investigating Membership Inference Attacks under Data Dependencies

Thomas Humphries , Simon Oya , Lindsey Tulloch , Matthew Rafuse , Ian Goldberg , Urs Hengartner , Florian Kerschbaum

分类：机器学习

2020-10-23

隐私敏感数据的培训机器学习模型已成为一种流行的练习，在不断扩大的田野中推动创新。这已经向新攻击打开了门，这可能会产生严重的隐私含义。一个这样的攻击，会员推导攻击（MIA），暴露了特定数据点是否用于训练模型。一种越来越多的文献使用差异的私人（DP）训练算法作为反对这种攻击的辩护。但是，这些作品根据限制假设评估防御，即所有培训集以及非成员的所有成员都是独立的并相同分布的。这种假设没有在文献中的许多真实用例中占据。由此激励，我们评估隶属于样本之间的统计依赖性，并解释为什么DP不提供有意义的保护（在这种更常规的情况下，培训集尺寸$ N $的隐私参数$ \ epsilon $ scales）。我们使用从现实世界数据构建的培训集进行了一系列实证评估，其中包括示出样品之间的不同类型依赖性的培训集。我们的结果表明，培训集依赖关系可能会严重增加MIS的性能，因此假设数据样本在统计上独立，可以显着低估均撒的性能。

translated by 谷歌翻译